Telegram Group & Telegram Channel
Что такое Local Sensitive Hash (LSH) и где он используется?

Это алгоритм, предназначенный для поиска ближайших соседей в больших наборах данных. Основывается на идее использования хеш-функции, которая переводит близкие объекты в один бакет (корзину).

У подходящих хеш-функций вероятность коллизии на близких объектах должна быть высокая, а на далёких — низкая. Иными словами, одинаковые хеш-значения должны с более высокой вероятностью присваиваться близким по некоторой метрике объектам.

При поиске ближайшего соседа для нового объекта сначала вычисляется его хеш-значение, а затем поиск ограничивается объектами в соответствующем бакете. Это позволяет значительно сократить объём данных, по которым необходимо провести поиск, а значит увеличить скорость обработки запросов.

LSH можно использовать в задачах, где требуется быстро находить похожие элементы в больших объёмах данных, например при поиске дубликатов документов или изображений в большом корпусе данных.

#машинное_обучение



tg-me.com/ds_interview_lib/230
Create:
Last Update:

Что такое Local Sensitive Hash (LSH) и где он используется?

Это алгоритм, предназначенный для поиска ближайших соседей в больших наборах данных. Основывается на идее использования хеш-функции, которая переводит близкие объекты в один бакет (корзину).

У подходящих хеш-функций вероятность коллизии на близких объектах должна быть высокая, а на далёких — низкая. Иными словами, одинаковые хеш-значения должны с более высокой вероятностью присваиваться близким по некоторой метрике объектам.

При поиске ближайшего соседа для нового объекта сначала вычисляется его хеш-значение, а затем поиск ограничивается объектами в соответствующем бакете. Это позволяет значительно сократить объём данных, по которым необходимо провести поиск, а значит увеличить скорость обработки запросов.

LSH можно использовать в задачах, где требуется быстро находить похожие элементы в больших объёмах данных, например при поиске дубликатов документов или изображений в большом корпусе данных.

#машинное_обучение

BY Библиотека собеса по Data Science | вопросы с собеседований


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/ds_interview_lib/230

View MORE
Open in Telegram


Библиотека собеса по Data Science | вопросы с собеседований Telegram | DID YOU KNOW?

Date: |

What Is Bitcoin?

Bitcoin is a decentralized digital currency that you can buy, sell and exchange directly, without an intermediary like a bank. Bitcoin’s creator, Satoshi Nakamoto, originally described the need for “an electronic payment system based on cryptographic proof instead of trust.” Each and every Bitcoin transaction that’s ever been made exists on a public ledger accessible to everyone, making transactions hard to reverse and difficult to fake. That’s by design: Core to their decentralized nature, Bitcoins aren’t backed by the government or any issuing institution, and there’s nothing to guarantee their value besides the proof baked in the heart of the system. “The reason why it’s worth money is simply because we, as people, decided it has value—same as gold,” says Anton Mozgovoy, co-founder & CEO of digital financial service company Holyheld.

Библиотека собеса по Data Science | вопросы с собеседований from fr


Telegram Библиотека собеса по Data Science | вопросы с собеседований
FROM USA